Thử thách Bài toán Về Khung Cảnh xuất phát từ sự bất cân xứng kiến trúc cơ bản: dữ liệu con người là đơn nhất và không cấu trúc, trong khi các Mô hình Ngôn ngữ Lớn (LLMs) lại là giới hạn token và dựa trên tập trung chú ý. Không có biến đổi, việc cung cấp dữ liệu thô vào một LLM sẽ dẫn đến "tình trạng nhiễm độc khung cảnh", nơi tiếng ồn không liên quan làm giảm hiệu suất suy luận.
Cầu Nối Chiến lược
Biến đổi không chỉ đơn thuần là chia tách kỹ thuật; đó là một quyết định chiến lược. Việc chia nhỏ không chỉ đơn thuần là tách văn bản. Nó là việc lựa chọn đơn vị mà quá trình truy xuất sẽ tìm kiếm và quá trình sinh tạo sẽ tiêu thụ sau này. Điều đó có nghĩa là việc chia nhỏ ảnh hưởng đến khả năng nhắc lại, xếp hạng, độ trễ, chất lượng câu trả lời, ngân sách token và tính dễ đọc của trích dẫn cùng lúc.
- Nén Ngữ nghĩa: Chúng ta nén khối hỗn loạn dữ liệu cao chiều thành một kiến trúc tối ưu cho cửa sổ giới hạn của LLM, đảm bảo rằng "cái kim trong đống rơm" là có thể đạt được.
- Ba yếu tố Vận hành: Biến đổi thành công phải cân bằng Quản lý dữ liệu (phân quyền), Chất lượng mô hình (lọc nhiễu), và Kiểm soát cập nhật mới (kiểm soát phiên bản).